热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

提法|赛道_Hadoop王者Cloudera新转型,定位为混合数据公司

篇首语:本文由编程笔记#小编为大家整理,主要介绍了Hadoop王者Cloudera新转型,定位为混合数据公司相关的知识,希望对你有一定的参考价值。作者|宋慧

篇首语:本文由编程笔记#小编为大家整理,主要介绍了Hadoop 王者 Cloudera 新转型,定位为混合数据公司相关的知识,希望对你有一定的参考价值。


作者 | 宋慧

出品 | CSDN 云计算


随着 AI 等技术兴起,对于数据的应用分析受到了越来越多的重视,数据赛道热度也持续火热。大数据时代为企业提供 Hadoop 服务的 Cloudera,也推出了新一代数据平台 CDP,并逐渐替代以往的大数据平台 CDH 和 HDP。


最近,CSDN 再次采访了 Cloudera 大中华区技术总监刘隶放,听听 Cloudera 对于云时代下,数据应用的新趋势的观察与经验。



数据愈加分散,范式转向数据网格 Data Mesh、数据编织、湖仓一体

近几年数据的发展,我们能看到,和以往企业对数据集中式管理不同,数字化的深入,让企业内部和外部都在产生超过以往数倍的数据量。另外不断变化的商业环境挑战下,企业对数据的分析和应用也需要更加灵活、敏捷。


因此,刘隶放首先分享了,在这些趋势下,行业对于数据范式的最新定义和趋势,那就是将数据与产品思维融合,将数据产品化,(在企业里)数据由最了解数据的域拥有,随时可供企业内的任何其他域使用,同时,数据需要具有可探索、可寻址、自描述、可信赖、可互操作(开放标准)、安全这六大特性,即数据网格 Data Mesh。总结起来,也是数据网格 Data Mesh 所对应的四个原则:域主权、数据为产品、自助式数据平台和联合计算治理。


随着数据的类型、数量、应用需求的复杂,业界逐步产生了对数据的处理新理念,那就是“数据编织(Data Fabric)”。连续几年对数据领域着重分析的 Gartner 在 2021 年讨论了这一提法,CSDN 曾做过报道: Gartner最新分析:数据编织、数据治理、平衡采集与连接 。



数据编织概念架构示意图


对于今年讨论度很高的,集合了数仓和数据湖优势的新数据应用系统湖仓一体,刘隶放认为其实数据网格、数据编织和湖仓一体,是企业中不同角色对于数据,不同的应用方法论。例如

数据使用者和技术工程师,专注于湖仓一体等新型数据系统如何用于具体业务和项目,而 CTO 则站在数据如何保持一致性、如何构建统一的数据标准的角度,去研究数据编织相关工作,企业管理者 CEO/CIO/CDO 在数据网格层面关注数据的管理成本和扩展性。



Cloudera 的新定位:混合数据公司

经历了 Hadoop 辉煌的大数据时代,现在的 Cloudera 正在转型,并将公司最新定位为混合数据公司,针对企业业务对数据新的需求,去提供适用于数据编织、数据湖库、数据网格和未来数据生态系统架构要求的混合数据平台的混合数据平台,允许客户在多个公共和私有云以及本地访问和分析数据,使企业能够做出由数据驱动的明智决策,帮助企业建立由数据驱动的未来。


而 Cloudera 新推出的 CDP 平台(Cloudera Data Platform),就是实现了对数据的大规模管理、分析、可移植性和安全治理,具体来说:

1、开放数据编织、湖仓,可在任何地方提供大规模数据;

2、多云和本地数据管理一体和数据网格和分析;

3、“一次编写,随处运行”实现数据分析的可移植性;

4、使用开放的云原生存储格式去统一安全和治理。


Cloudera CDP 可支持现代数据架构各层需求


刘隶放分享了 Cloudera 的 CDP 平台,对企业现代数据架构各层需求的支持。例如在数据网格层,CDP 面向域的分布式数据产品,由拥有嵌入式数据工程师和数据产品所有者的独立跨职能团队拥有,使用通用数据基础设施作为平台来托管、准备和服务其数据资产。CDP 也集成和统一数据仓库和数据湖的功能,旨在支持同一数据集上的 AI、BI、ML 和数据工程(“多功能分析”)。在数据编织和编排上,CDP 以自助服务的方式智能、安全地动态编排不同的数据源,利用数据平台提供集成的可信数据,以支持各种应用程序、分析和其他工作负载。另外,CDP 也支持混合云和多云,保持数据系统跨所有环境的一致性体验。


数据越来越重要,也越来越被关注。从专业数据厂商 Cloudera 的新定位,我们也能看到,数据分析应用,从数据中台正在形成更完整的系统平台,同时除了一线的数据工程师、CTO 之外,也需要企业的管理者去关注。



推荐阅读
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 企业数据应用挑战及元数据管理的重要性
    本文主要介绍了企业在日常经营管理过程中面临的数据应用挑战,包括数据找不到、数据读不懂、数据不可信等问题。针对这些挑战,通过元数据管理可以实现数据的可见、可懂、可用,帮助业务快速获取所需数据。文章提出了“灵魂”三问——元数据是什么、有什么用、又该怎么管,强调了元数据管理在企业数据治理中的基础和前提作用。 ... [详细]
  • 本文介绍了OpenStack的逻辑概念以及其构成简介,包括了软件开源项目、基础设施资源管理平台、三大核心组件等内容。同时还介绍了Horizon(UI模块)等相关信息。 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • 云原生应用最佳开发实践之十二原则(12factor)
    目录简介一、基准代码二、依赖三、配置四、后端配置五、构建、发布、运行六、进程七、端口绑定八、并发九、易处理十、开发与线上环境等价十一、日志十二、进程管理当 ... [详细]
  • 14亿人的大项目,腾讯云数据库拿下!
    全国人 ... [详细]
  • BPM是什么软件?1、BPM是BusinessProcessManagement的简称,译为业务流程管理,它是一种以规范化的构造端到端的卓越业务流程为中心以持续的提高组织业务绩效为 ... [详细]
  • TiDB | TiDB在5A级物流企业核心系统的应用与实践
    TiDB在5A级物流企业核心系统的应用与实践前言一、业务背景科捷物流概况神州金库简介二、现状与挑战神州金库现有技术体系业务挑战应对方案三、TiDB解决方案测试迁移收益问题四、说在最 ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES
    一、认识ElasticSearch是一个基于Lucene的开源搜索引擎,通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索,分析系统&# ... [详细]
  • {moduleinfo:{card_count:[{count_phone:1,count:1}],search_count:[{count_phone:4 ... [详细]
  • 寻求更强大的身份和访问管理(IAM)平台的企业正在转向云,并接受身份即服务(IDaaS)的灵活性。要为IAM选择正确的场外解决方案,业务管理人员和IT专业人员必须在实施之前评估安全 ... [详细]
  • 地产科技战:10+
    作者|肖漫出品|雷锋网产业组一场房地产巨头的求变征战,正悄然开启。近年来,在限价限购、“房住不炒”以及三道红线的调控政策下,房地产企业竞相加快转型升级的步伐。一方面,房地产市场增量 ... [详细]
author-avatar
逍遥子
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有